Список находок оказался лимитирован числом находок. В параметрах алгоритма я менял число отображаемых последовательностей от 100 до 500
Длина слова | Кол-во находок | E-value<0.001 | Max E-value |
6 | 475 | 475 | 6,00E-29 |
2 | 484 | 475 | 9.6 |
Для этого задания я выбрал белок C1FN38.1 и производил поиск по таксону Firmicutes. E-value выравнивания при использовании всего банка составил 2e-90, а при выравнивании с данным таксоном 2e-91. Отсюда можно сделать вывод о том, что в банке содержится большое число белков принадлежащих моему таксону, а именно 1\10 часть всего банка. Из-за изменения объема банка меняется только вес в битах, обычный вес остается неизменным.